iT邦幫忙

2023 iThome 鐵人賽

DAY 8
0
AI & Data

30天輕鬆搞定資料分析系列 第 22

DAY-22 認識統計學(2):抽樣方法、常用機率分配

  • 分享至 

  • xImage
  •  

一般常用抽樣方法可分為:隨機抽樣、非隨機抽樣。

非隨機抽樣法(non-random sampling):

-> 根據個人主觀意志抽取。

隨機抽樣法(random sampling):

-> 條件:母體內任何元素皆可能被抽出+任意樣本被抽取機率皆已知或可計算得知+任意樣本抽取過程皆獨立。
-> 依照被抽取機率可分為:簡單隨機抽樣法、群集隨機抽樣法、分層隨機抽樣法、系統隨機抽樣法、多階段抽樣法。

  • 簡單隨機抽樣:含有N個元素的母體中,隨機抽取n個元素為一組樣本,每一個樣本點被抽到的 機會均相同。
  • 分層隨機抽樣:抽樣前先將整個母體分成k個不重疊的部份母體(層),在各層內按比例,以簡單隨機抽樣法抽出各層之隨機樣本。
  • 群集隨機抽樣:將整個母體按地域關係或方便性,分成若干個性質相似的部落,從中隨機抽取數個部落為隨機部落樣本。

常用的機率分配:

二項機率分配 Binomial Distribution

  • 伯努力試驗:僅試驗一次且有兩種可能的結果,成功/失敗。
  • 二項試驗:重複進行N次伯努力試驗,且每次接獨立。成功機率為p/失敗為q=p-1。
  • 二項分配:隨機變數X為N次伯努力試驗中成功的次數。

常態分配 Normal Distribution:

群體的差異大概落在某個範圍。特質有:

  • 以µ為中心的對稱分配
  • 曲線下面面積總合等於1
  • 在X等於µ +- 𝜎時有一個轉折點
  • 兩尾無限延伸,與X軸不會有焦點

T分配

樣本數小於30且不知母體標準差。特色:

  • T分配為連續行機率分配
  • T分配圖形成中型對稱
  • 比標準常態分配更平坦且離散程度較大

F分配

若U ~ x^2(n),V ~ x^2(m),U與V為獨立的隨機變數。

  • F ~ F(n,m)時,所有可能直接大於等於0且為右偏分配,n為分子自由度,m為分母自由度。
  • X ~ F(n,m) 時,則1 X ~ F(m,n)

上一篇
DAY-21 認識統計學(1):基本概念、描述/推論性統計
下一篇
DAY-23 延伸内容(1):自然語言處理、機器學習基礎
系列文
30天輕鬆搞定資料分析30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言